多元線性回歸是一種用於預測一個或多個自變量對因變量的影響的統計模型在多元線性回歸中,我們假設因變量與多個自變量之間存在線性關系
基本原理:y=β+β1*x1+β2*x2+β3*x3+...+βn*xn+ε
ε 是誤差項,表示模型無法解釋的部分
多元線性回歸的目標是通過擬合模型找到合適的系數 β 來最小化誤差項 ε
from sklearn.linear_model import LinearRegression
import pandas as pd
# 生成示例數據
data = {'廣告費用': [200, 300, 400, 500, 600],
'促銷活動': [0, 1, 1, 2, 3],
'銷售額': [1200, 1400, 1600, 1800, 2000]}
df = pd.DataFrame(data)
# 初始化線性回歸模型
model = LinearRegression()
# 提取特征和目標變量
X = df[['廣告費用', '促銷活動']]
y = df['銷售額']
# 在訓練集上訓練模型
model.fit(X, y)
# 預測銷售額
new_data = pd.DataFrame({'廣告費用': [700], '促銷活動': [4]})
predicted_sales = model.predict(new_data)
print(f'預測的銷售額為:{predicted_sales[0]}')